• شماره های پیشین

    • فهرست مقالات درخت تصمیم

      • دسترسی آزاد مقاله

        1 - دسته‌بندی داده‌های دورده‌ای با ابرمستطیل موازی محورهای مختصات
        زهرا مصلحی مازیار پالهنگ
        یکی از زمینه‌های فعالیت در یادگیری ماشین و شناسایی الگو یادگیری با ناظر می‌باشد. در یادگیری با ناظر برچسب داده‌های آموزشی موجود است. در مسایل دورده‌ای، هدف محاسبه فرضیه‌ای است که بتواند به بهترین شکل ممکن و با کمترین مقدار خطا داده‌های با دو ردهی مثبت و منفی را از یکدیگ چکیده کامل
        یکی از زمینه‌های فعالیت در یادگیری ماشین و شناسایی الگو یادگیری با ناظر می‌باشد. در یادگیری با ناظر برچسب داده‌های آموزشی موجود است. در مسایل دورده‌ای، هدف محاسبه فرضیه‌ای است که بتواند به بهترین شکل ممکن و با کمترین مقدار خطا داده‌های با دو ردهی مثبت و منفی را از یکدیگر جدا کند. انواع روش‌های یادگیری با ناظر پیشنهاد شده است. به عنوان مثال می‌توان به درخت‌های تصمیم، یادگیر SVM و روش‌های نزدیکترین همسایه اشاره کرد. در این مقاله بر عملکرد درخت‌های تصمیم متمرکز می‌شویم. عملکرد درخت تصمیم مشابه پیدا کردن ابرصفحه‌های تقسیم‌کننده در فضای d بعدی است، بطوریکه داده‌های موجود را به درستی رده‌بندی کند و تا حد ممکن رده‌بندی صحیح داده‌های آینده را نیز بدست آورد. دیدگاه هندسی عملکرد درخت تصمیم ما را به مفهوم تفکیک‌پذیری در هندسه محاسباتی نزدیک می‌کند. از بین کلیه الگوریتم‌های تفکیک‌پذیری موجود، مساله محاسبه مستطیل با حداکثر اختلاف دو رنگ را مطرح می‌کنیم. این مساله ارتباط نزدیکی با مساله درخت تصمیم در یادگیری ماشین دارد. در ادامه الگوریتم محاسبه مستطیل با حداکثر اختلاف دو رنگ را در یک، دو، سه و d بعد پیاده سازی می‌کنیم. نتیجه پیاده‌سازی نشان‌دهنده آن است که این الگوریتم، الگوریتمی قابل رقابت با الگوریتم شناخته شده C4.5 است. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - تلفیق مدل تحلیل پوششی داده¬ها و درخت تصمیم به منظور ارزیابی واحدهای مبتنی بر تکنولوژی اطلاعات
        امیر امینی علی علی نژاد سمیه  شفقی زاده
        هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری ک چکیده کامل
        هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کارایی و بهره وری از واحدهای تصمیم گیری (DMUs)هاست. از طرف دیگر تکنیک داده کاوی به DMUs))ها اجازه کاوش و کشف اطلاعات معنی داری، که قبلاً در پایگاه داده های بزرگ پنهان بوده اند را می دهد. این مقاله یک چارچوب کلی ترکیب تحلیل پوششی داده ها بادرخت رگرسیون را برای ارزیابی کارایی و بهره وری ازDMUها پیشنهاد می کند. نتیجه مدل ترکیبی مجموعه ای از قوانین است که می تواند توسط سیاست گذاران برای کشف دلایلDMUهای کارآمد و ناکارآمد مورد استفاده قرار گیرد. به عنوان مطالعه موردی با استفاده از روش پیشنهادی برای بررسی عوامل مرتبط با بهره وری نمونه ای شامل 18 شعبه از بیمه ایران در شهر تهران انتخاب گردید و پس از مدل سازی بر مبنای مدل پیشرفته LVM ورودی محور با دسترسی پذیری ضعیف درتحلیل پوششی داده ها با خروجی نامطلوب محاسبه گردید و با تکنیک درخت تصمیم، به استخراج قوانین برای کشف دلایل افزایش بهره وری و پسرفت بهره وری می پردازد. پرونده مقاله
      • دسترسی آزاد مقاله

        3 - تلفیق مدل تحلیل پوششی داده¬ها و درخت تصمیم به منظور ارزیابی واحدهای مبتنی بر تکنولوژی اطلاعات
        امیر امینی علی رضا علی نژاد سمیه  شفقی¬زاده
        هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری ک چکیده کامل
        هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کارایی و بهره وری از واحدهای تصمیم گیری (DMUs)هاست. از طرف دیگر تکنیک داده کاوی به DMUs))ها اجازه کاوش و کشف اطلاعات معنی داری، که قبلاً در پایگاه داده های بزرگ پنهان بوده اند را می دهد. این مقاله یک چارچوب کلی ترکیب تحلیل پوششی داده ها بادرخت رگرسیون را برای ارزیابی کارایی و بهره وری ازDMUها پیشنهاد می کند. نتیجه مدل ترکیبی مجموعه ای از قوانین است که می تواند توسط سیاست گذاران برای کشف دلایلDMUهای کارآمد و ناکارآمد مورد استفاده قرار گیرد. به عنوان مطالعه موردی با استفاده از روش پیشنهادی برای بررسی عوامل مرتبط با بهره وری نمونه ای شامل 18 شعبه از بیمه ایران در شهر تهران انتخاب گردید و پس از مدل سازی بر مبنای مدل پیشرفته LVM ورودی محور با دسترسی پذیری ضعیف درتحلیل پوششی داده ها با خروجی نامطلوب محاسبه گردید و با تکنیک درخت تصمیم، به استخراج قوانین برای کشف دلایل افزایش بهره وری و پسرفت بهره وری می پردازد. پرونده مقاله
      • دسترسی آزاد مقاله

        4 - دسته‌بندی داده‌های دو رده‌ای با ابرمستطیل موازی محورهای مختصات
        زهرا مصلحی مازیار پالهنگ
        یکی از روشهای یادگیری در یادگیری ماشین و شناسایی الگو، یادگیری با ناظر است. در یادگیری با ناظر و در مسایل دو رده‌ای، برچسب دادههای آموزشی موجود و شامل دو رده مثبت و منفی میباشند. هدف الگوریتم یادگیری با ناظر، محاسبه فرضیه‌ای است که بتواند با کمترین مقدار خطا، داده‌های م چکیده کامل
        یکی از روشهای یادگیری در یادگیری ماشین و شناسایی الگو، یادگیری با ناظر است. در یادگیری با ناظر و در مسایل دو رده‌ای، برچسب دادههای آموزشی موجود و شامل دو رده مثبت و منفی میباشند. هدف الگوریتم یادگیری با ناظر، محاسبه فرضیه‌ای است که بتواند با کمترین مقدار خطا، داده‌های مثبت و منفی را از یکدیگر جدا کند. در این مقاله، از بین کلیه الگوریتمهای یادگیری با ناظر، بر عملکرد درخت‌های تصمیم متمرکز می‌شویم. دیدگاه هندسی درخت تصمیم ما را به مفهوم تفکیک‌پذیری در هندسه محاسباتی نزدیک می‌کند. از بین کلیه الگوریتم‌های تفکیک‌پذیری موجود و مرتبط با درخت تصمیم، مساله محاسبه مستطیل با حداکثر اختلاف دو رنگ را مطرح می‌کنیم و الگوریتم را در یک، دو، سه و m بعد پیادهسازی می‌کنیم که m تعداد ویژگیهای دادهها را نشان میدهد. نتیجه پیاده‌سازی نشان‌دهنده آن است که این الگوریتم، الگوریتمی قابل رقابت با الگوریتم شناخته شده C4.5 است. پرونده مقاله
      • دسترسی آزاد مقاله

        5 - تشخیص خودکار بیماری های ریوی با استفاده از ویژگی های مبتنی بر تبدیل کسینوسی گسسته در تصاویر رادیوگرافی
        شمیم یوسفی صمد نجارقابل
        استفاده از نتایج خام رادیوگرافي در تشخیص بیماريهاي ریوي عملکرد قابلقبولي ندارد. یادگیري ماشین ميتواند به تشخیص دقیقتر بیماريها کمک کند. مطالعات گستردهاي در حوزه تشخیص خودکار بیماريها با کمک یادگیري ماشین کلاسیک و عمیق انجام شده؛ اما این روشها دقت و کارایي قابلقبولي ندار چکیده کامل
        استفاده از نتایج خام رادیوگرافي در تشخیص بیماريهاي ریوي عملکرد قابلقبولي ندارد. یادگیري ماشین ميتواند به تشخیص دقیقتر بیماريها کمک کند. مطالعات گستردهاي در حوزه تشخیص خودکار بیماريها با کمک یادگیري ماشین کلاسیک و عمیق انجام شده؛ اما این روشها دقت و کارایي قابلقبولي ندارند یا به دادههاي یادگیري زیادي نیاز دارند. براي مقابله با این چالشها، در این مقاله، روش جدیدي براي تشخیص خودکار بیماريهاي ریوي بینابیني در تصاویر رادیوگرافي ارائه ميشود. در گام اول، اطلاعات بیمار از تصاویر حذف شده؛ سپس، پیکسلهاي باقیمانده، جهت پردازشهاي دقیقتر، استانداردسازي ميشوند. در گام دوم، پایایي روش پیشنهادي با کمک تبدیل رادان بهبود یافته، دادههاي اضافي با استفاده از فیلتر Top-hat حذف شده و نرخ تشخیص با بهرهبرداري از تبدیل موجک گسسته و تبدیل کسینوسي گسسته افزایش ميیابد. سپس، تعداد ویژگيهاي نهایي با کمک آنالیز تشخیصي حساس به مکان کاهش ميیابد. در گام سوم، تصاویر پردازششده به دو دسته یادگیري و تست تقسیم ميشوند؛ با استفاده از دادههاي یادگیري، مدلهاي مختلفي ایجاد شده و با کمک دادههاي تست، بهترین مدل انتخاب ميشود. نتایج شبیهسازيها بر روي مجموعه داده NIH نشان ميدهد که روش پیشنهادي مبتني بر درخت تصمیم با بهبود میانگین هارمونیک حساسیت و صحت تا 08 / 1 برابر، دقیقترین مدل را ارائه ميدهد. پرونده مقاله
      • دسترسی آزاد مقاله

        6 - ارائه مدلی برای پیش بینی بقای بیماران مبتلا به ملانوم بر اساس الگوریتم های داده کاوی
        فریناز صناعی سید عبدالله امین موسوی عباس طلوعی اشلقی علی  رجب زاده قطری
        مقدمه: ملانوم جزء شایعترین سرطان تشخیصي و دومین علت مرگ ناشي از سرطان در میان افراد است. تعداد مبتلایان به آن در حال افزایش است. ملانوم، نادرترین و بدخیم ترین نوع سرطان پوست است.در شرایط پیشرفته توانایي انتشار به ارگانهاي داخلي را دارد و ميتواند منجر به مرگ شود. طبق ب چکیده کامل
        مقدمه: ملانوم جزء شایعترین سرطان تشخیصي و دومین علت مرگ ناشي از سرطان در میان افراد است. تعداد مبتلایان به آن در حال افزایش است. ملانوم، نادرترین و بدخیم ترین نوع سرطان پوست است.در شرایط پیشرفته توانایي انتشار به ارگانهاي داخلي را دارد و ميتواند منجر به مرگ شود. طبق برآوردهاي انجمن سرطان آمریکا براي ملانوم در ایالاتمتحده براي سال 2022 عبارتاند از: حدود 99،780 ز افراد مبتلابه ملانوم تشخیص داده شدند و حدود 7،650 نفر در اثر ملانوم جان خود را از دست ميدهند. لذا هدف از این مطالعه، طراحي بهبود دقت الگوریتم براي پیش بیني بقاي این بیماران است. روش پژوهش: روش حاضر کاربردي، توصیفي- تحلیلي و گذشتهنگر است. جامعه پژوهش را بیماران مبتلابه سرطان ملانوم پایگاه داده مرکز تحقیقات کشوري سرطان دانشگاه شهید بهشتي ) 1۳87 تا 1۳91 ( که تا 5 سال مورد پیگیري قرارگرفته بودند، تشکیل داده است. مدل پیشبیني بقاي ملانوم بر اساس شاخص هاي ارزیابي الگوریتم هاي داده کاوي انتخاب شد. یافته ها: الگوریتم هاي شبکه عصبي، بیز ساده، شبکه بیزي، ترکیب درخت تصمیم گیري با بیز ساده، رگرسیون لجستیک، J48 ، ID3 بهعنوان مدل هاي استفاده شده ي پایگاه داده کشور انتخاب شدند . عملکرد شبکه عصبي در همه شاخصهاي ارزیابي ازلحاظ آماري نسبت به سایر الگوریتم هاي منتخب بالاتر بود. نتیجه گیري: نتایج مطالعه حاضر نشان داد که شبکه عصبي با مقدار 97 / 0 ازلحاظ دقت پیش بیني عملکرد بهینه دارد. بنابراین مدل پیش بیني کننده بقاي ملانوم، هم ازلحاظ قدرت تمایز و هم ازلحاظ پایایي، عملکرد بهتري از خود نشان داد؛ بنابراین، این الگوریتم به عنوان مدل پیش بیني بقاي ملانوم پیشنهاد شد پرونده مقاله